This paper describes the 5th edition of the Predicting Video Memorability Task as part of MediaEval2022. This year we have reorganised and simplified the task in order to lubricate a greater depth of inquiry. Similar to last year, two datasets are provided in order to facilitate generalisation, however, this year we have replaced the TRECVid2019 Video-to-Text dataset with the VideoMem dataset in order to remedy underlying data quality issues, and to prioritise short-term memorability prediction by elevating the Memento10k dataset as the primary dataset. Additionally, a fully fledged electroencephalography (EEG)-based prediction sub-task is introduced. In this paper, we outline the core facets of the task and its constituent sub-tasks; describing the datasets, evaluation metrics, and requirements for participant submissions.
translated by 谷歌翻译
The Predicting Media Memorability task in the MediaEval evaluation campaign has been running annually since 2018 and several different tasks and data sets have been used in this time. This has allowed us to compare the performance of many memorability prediction techniques on the same data and in a reproducible way and to refine and improve on those techniques. The resources created to compute media memorability are now being used by researchers well beyond the actual evaluation campaign. In this paper we present a summary of the task, including the collective lessons we have learned for the research community.
translated by 谷歌翻译
本文介绍了预测媒体难忘性的Mediaeval 2021,这是今年第4版的任务,因为短期和长期视频难忘性的预测仍然是一个具有挑战性的任务。在2021年,使用两个视频数据集:第一,TRECVID 2019视频到文本数据集的子集;其次,Memento10K数据集是为了提供探索交叉数据集泛化的机会。另外,介绍了基于脑电图(EEG)的预测导频子任务。在本文中,我们概述了任务的主要方面,并描述了参与者提交的数据集,评估指标和要求。
translated by 谷歌翻译
在过去的十年中,基因组数据的可用性已成倍增长,这主要是由于新测序技术的发展。基于从增加的基因组数据中提取的基因(和基因产物)之间的相互作用,许多研究集中在基因与功能之间的关联鉴定上。尽管这些研究表现出了很大的希望,但用功能注释基因的问题仍然是一个悬而未决的挑战。在这项工作中,我们提出了一种检测层次多标签分类数据集中缺失注释的方法。我们提出了一种通过将汇总概率计算到每个实例的从叶子到根的类路径来利用类层次结构的方法。提出的方法是在预测缺失基因函数注释的背景下提出的,其中这些汇总概率被进一步用于选择一组通过体内实验验证的注释。各种大米的Oriza Sativa Japonica的实验,将类别的层次结合到该方法中通常会改善预测性能,而我们所提出的方法与文献相比,我们提出的方法可以提高结果。
translated by 谷歌翻译
在本文中,我们检查了复杂性的概念,因为它适用于生成和进化艺术和设计。复杂性具有许多不同,纪律的特定定义,例如物理系统(熵)的复杂性,信息复杂性的算法测量和“复杂系统”。我们将一系列不同的复杂度措施应用于三个不同的进化艺术数据集,并查看艺术家的复杂性和个人审美判断之间的相关性(在两个数据集的情况下)或生成3D形式的物理测量复杂性。我们的结果表明,每个集合和测量的相关程度都不同,表明没有整体“更好”的措施。但是,具体措施确实在各个数据集中表现良好,表明仔细选择可以增加使用此类措施的值。然后,我们通过对复杂性和美学的看法进行大规模调查来评估观众复杂度措施的价值。我们通过讨论生成和进化艺术中的直接措施的价值来得出结论,提高神经影像学和心理学的最新发现,这提出了人类审美判断的许多外在因素,超出了所判断的物体的可测量特性。
translated by 谷歌翻译
作为最普遍的神经退行性疾病之一,帕金森病(PD)对患者的精细运动技能产生了重大影响。在语音生产过程中不同铰接器的复杂相互作用和所需肌肉张力的实现变得越来越困难,从而导致发狂的言论。在受影响的个体中通常可以观察到元音不稳定性,浆液发音和慢演说的特征模式,并在先前的研究中分析以确定PD的存在和进展。在这项工作中,我们使用了专门培训的语音识别器,以研究PD如何影响患者的语音占地面积。我们重新发现了许多在以前的贡献中描述的模式,尽管我们的系统从未见过此前从未见过任何病理演讲。此外,我们可以表明来自神经网络的中间激活可以用作编码与个人疾病状态有关的信息的特征向量。我们还能够直接将演讲者的专家额定智能性与语音预测的平均置信相提并论。我们的结果支持假设,即培训能够分析PD语音的系统不一定需要病理数据。
translated by 谷歌翻译
客户服务Chatbots是对话系统,旨在为客户提供有关不同公司提供的产品/服务的信息。特别地,意图识别是自然语言低估Chatbot系统的能力的核心组件之一。在聊天训练识别的不同意图中,他们有一组是通用的任何客户服务Chatbot。普遍意图可以包括称呼,将对话交给人类代理人,告别。识别这些普遍意图的系统将非常有助于优化特定客户服务聊天训练过程。我们提出了一个普遍意图识别系统的发展,该系统受过培训,以识别28个不同的聊天跳闸中常见的11个意图组。拟议的系统考虑了最先进的单词嵌入模型,例如Word2VEC和BERT,基于卷积和经常性神经网络的深层分类器。所提出的模型能够区分这些普遍意图,均衡精度高达80.4 \%。此外,所提出的系统同样准确地识别短期和长文本请求中表达的意图。同时,错误分类错误通常发生在具有非常相似的语义领域,例如告别和正面评论之间。建议的系统将非常有帮助优化客户服务Chatbot的培训过程,因为我们的系统已经可用并检测到一些意图。与此同时,拟议的方法将是一个合适的基础模型,通过应用转移学习策略培训更具体的聊天措施。
translated by 谷歌翻译
AI正在经历范式转变,随着模型的兴起(例如Bert,Dall-E,GPT-3),这些模型经过大规模的数据训练,并且可以适应广泛的下游任务。我们称这些模型基础模型来强调其至关重要但不完整的特征。该报告提供了基础模型的机会和风险的详尽说明,包括其功能(例如语言,愿景,机器人技术,推理,人类互动)和技术原则(例如,模型架构,培训程序,数据,系统,安全,安全性,评估,理论)对其应用(例如法律,医疗保健,教育)和社会影响(例如不平等,滥用,经济和环境影响,法律和道德考虑)。尽管基础模型基于标准的深度学习和转移学习,但它们的规模导致了新的新兴能力,以及它们在许多任务中的有效性都激发了同质化。同质化提供了强大的杠杆作用,但要求谨慎,因为基础模型的缺陷均由下游的所有适应模型继承。尽管即将广泛地部署基础模型,但我们目前对它们的工作方式,失败以及由于其新兴属性的影响而缺乏清晰的了解。为了解决这些问题,我们认为基础模型的许多批判性研究都需要与他们的基本社会技术性质相称。
translated by 谷歌翻译